13.1 시간적 추상화와 장기 계획의 난제 (Temporal Abstraction & Long-Horizon Problems)
- 13.1 시간적 추상화와 장기 계획의 난제 (Temporal Abstraction & Long-Horizon Problems)
- 13.1.1 차원의 저주와 시간의 저주: 타임 스텝이 길어질수록 기하급수적으로 증가하는 탐색 공간과 신용 할당(Credit Assignment) 문제 분석
- 13.1.2 희소 보상(Sparse Reward) 환경에서의 한계: 단순 탐험(Epsilon-greedy) 전략의 실패와 구조적 탐험의 필요성
- 13.1.3 시간적 추상화(Temporal Abstraction): 인간의 사고 방식(단위 행동의 조합)을 모방한 로봇 제어의 계층화 개념